Qudata领域信息情报检索

收集有关机器学习和人工智能开发服务的最新新闻,数据更新和研究结果。Qudata是一家于2018年从游戏开发公司崛起,并转型专注于解决复杂的机器学习和人工智能挑战的初创公司。

现实生活变压器:无人机在空中变形

Real-life transformer: Drone morphs mid-air

atto是一个机器人,将空中从飞行无人机转变为地面流动站。通过克服混合机器人的长期挑战被困在粗糙的地形上,这一突破释放了自主交付,灾难响应和行星探索的新可能性。

AI学会同步视觉和声音

AI learns to sync sight and sound

MIT研究人员开发了Cav-Mae Sync,这是一种AI模型,该模型学会了将声音与视频中的匹配视觉效果联系起来,而无需任何标签。这项技术可以使我们更接近更聪明的人工智能,就像人类一样,可以看到,听到和理解世界。

Google I/O 2025:日常技术核心的AI

Google I/O 2025: AI at the core of everyday technology

Google I/O 2025上介绍的最迷人的创新揭示了AI如何改变搜索,视频创建和通信。这些进步是重新定义日常技术,使其比以往任何时候都更加聪明,更直观和个性化。

AI的幻觉问题越来越严重

AI’s hallucination problem is getting worse

来自OpenAI和DeepSeek等科技巨头的最先进的AI模型正在以前所未有的速度生成虚假信息 - 没人知道为什么。由于AI幻觉的这种激增,跨关键领域的AI可靠性受到质疑。

PHI-4 - 小型模型,大结果

Phi-4 – small models, big results

Microsoft的Phi-4家族是新一代的紧凑型语言模型,为数学,编码和计划等复杂任务建立,通常超过较大的系统。经过高级技术和精选数据培训,它们提供了强大的推理,同时又可以效率地用于低延迟使用。

没有规则,只是共鸣!什么是氛围编码?

No rules, just vibes! What is vibe coding?

为什么当AI可以通过开发为您“振动”时,为什么要强调代码的每一行? Vibe编码是一个快速增长的趋势,开发人员让AI在编写代码中占据主导地位,将编程转换为更直观和自发的过程。

nvidia刚刚使游戏物理学成为每个人的游乐场

NVIDIA just made game physics a playground for everyone

nvidia已正式制作了其Physx Engine和Flow SDK完全开源的,包括期待已久的GPU模拟内核代码,并在BSD-3许可下。现在,即使在非NVIDIA GPU上,开发人员也可以自定义,端口和复兴的高级物理模拟。

MidJourney V7:更快,更聪明,更现实

Midjourney V7: Faster, smarter, more realistic

MidJourney推出了V7,即迄今为止最强大的AI映像模型,具有更智能的提示和实时个性化。通过重新设计的体系结构,V7提供了改进的对象连贯性,增强的纹理现实主义,并引入了快速,具有成本效益的图像迭代的草稿模式。

超级疲倦的AI:像人类思维一样学习

Super-Turing AI: Learning like the human mind

模仿大脑学习过程的新的高级神经系统有望创造更快,更高效和节能的AI。通过利用Hebbian学习和依赖于峰值的可塑性,这一创新可以提高AI的性能,同时大大降低环境和经济成本。

AI工具在X射线分析中提高了透明度

AI tool enhances transparency in X-ray analysis

ITPCTRL-AI通过模仿放射科医生的凝视模式来改善X射线诊断,提供可解释的热图,从而提高对AI驱动的医学成像的透明度和信任。通过滤除无关紧要的数据并专注于关键诊断区域,该系统可确保更准确和可解释的结果。

GPT-4.5 - AI功能的飞跃

GPT-4.5 – a leap forward in AI capabilities

gpt-4.5是Openai最先进的AI,具有改进的自然语言理解,增强的情绪智力和更直观的对话。它以书面形式,集思广益和解决问题的方式出色,同时最大程度地减少AI幻觉,以获得更可靠的结果。

飞行盲人:如何在Total Darkness中导航无人机

Flying blind: How to navigate drones in total darkness

麻省理工学院的研究人员已经开发了Mifly,这是一种基于RF的低功耗系统,使无人机能够在完全黑暗,室内和低可见性条件下自定位。通过使用单个反向散射标签和双极化雷达,Mifly在不依赖视觉提示或外部基础架构的情况下导航。

Nvidia Cosmos - AI Robotics背后的秘密武器

NVIDIA Cosmos – the secret weapon behind AI robotics

nvidia cosmos通过产生逼真的3D环境来增强AI机器人技术,从而使开发人员能够在不依赖昂贵的真实世界数据的情况下训练自主系统。借助高级世界基础模型,Cosmos推动了机器人技术,自动驾驶汽车和工业自动化的创新。

视频发电的最大开源AI

The largest open-source AI model for video generation

Hunyuanvideo是视频生成的最大开源AI模型,拥有130亿个参数,以产生具有栩栩如生的运动和完美同步音频的高质量的电影视频。为AI驱动的内容创建设置新的基准,它提供了无与伦比的现实主义,精度和创造性的可能性。

SUPER 无人机双轨迹策略的妙处

The genius of SUPER drone’s two-trajectory strategy

双轨迹规划系统让 MAV 能够探索未知路径,同时始终保持安全的备用路线。借助基于 LiDAR 的感知和 CIRI 算法,无人机可以动态生成实时飞行路径,以便在不可预测的环境中实现高速导航。

从文本到 3D:NVIDIA 的 Edify 3D 背后的魔力

From text to 3D: the magic behind Edify 3D by NVIDIA

NVIDIA 的 Edify 3D 使用 AI 在 2 分钟内创建高质量的 3D 模型。通过结合多视图扩散模型和 Transformers,它可以从文本或图像快速、准确且可扩展地生成 3D,使其成为游戏、动画和设计行业的完美解决方案。

微软推出完全开放权重的Phi-4型号

Microsoft launched the Phi-4 model with fully open weights

微软在 MIT 许可下推出了具有开放权重的 Phi-4 模型,为研究人员和开发人员提供了前所未有的灵活性。凭借 140 亿个参数,Phi-4 在解决数学问题和多任务处理方面的表现优于同类产品,确保以有限的资源高效工作。

RadiologyLlama-70B:放射学报告的新语言模型

RadiologyLlama-70B: A new language model for radiology reports

RadiologyLlama-70B 是一种先进的 AI 模型,经过超过 650 万份医疗报告的训练,可增强对放射学发现的分析。该模型可以显著改善放射科医生的工作流程,在降低计算成本的同时提供卓越的准确性。